智能论文笔记

Map Container: A Map-based Framework for Cooperative Perception

Kun Jiang , Yining Shi , Benny Wijaya , Mengmeng Yang , Tuopu Wen , Zhongyang Xiao , Diange Yang

分类：机器人

2022-08-28

合作感知的想法是从多辆车之间的共同感知数据中受益，并克服单车上车载传感器的局限性。但是，由于本地化不准确，通信带宽和模棱两可的融合，多车信息的融合仍然具有挑战性。过去的实践通过放置精确的GNSS定位系统来简化问题，手动指定连接的车辆数量并确定融合策略。本文提出了一个基于地图的合作感知框架，名为MAP容器，以提高合作感的准确性和鲁棒性，最终克服了这个问题。概念“地图容器”表示地图是将所有信息转换为地图坐标空间的平台，并将不同的信息源合并到分布式融合体系结构中。在拟议的MAP容器中，考虑使用GNSS信号和传感器功能和地图功能之间的匹配关系以优化环境状态的估计。对仿真数据集和房地车平台的评估结果验证了所提出的方法的有效性。

translated by 谷歌翻译

Exploring Singularities in point clouds with the graph Laplacian: An explicit approach

Martin Andersson , Benny Avelin

分类： (统计)机器学习 | 机器学习

2022-12-31

We develop theory and methods that use the graph Laplacian to analyze the geometry of the underlying manifold of point clouds. Our theory provides theoretical guarantees and explicit bounds on the functional form of the graph Laplacian, in the case when it acts on functions defined close to singularities of the underlying manifold. We also propose methods that can be used to estimate these geometric properties of the point cloud, which are based on the theoretical guarantees.

translated by 谷歌翻译

Multilingual News Location Detection using an Entity-Based Siamese Network with Semi-Supervised Contrastive Learning and Knowledge Base

Víctor Suárez-Paniagua , Steven Derby , Tri Kurniawan Wijaya

分类：自然语言处理 | 人工智能

2022-12-22

Early detection of relevant locations in a piece of news is especially important in extreme events such as environmental disasters, war conflicts, disease outbreaks, or political turmoils. Additionally, this detection also helps recommender systems to promote relevant news based on user locations. Note that, when the relevant locations are not mentioned explicitly in the text, state-of-the-art methods typically fail to recognize them because these methods rely on syntactic recognition. In contrast, by incorporating a knowledge base and connecting entities with their locations, our system successfully infers the relevant locations even when they are not mentioned explicitly in the text. To evaluate the effectiveness of our approach, and due to the lack of datasets in this area, we also contribute to the research community with a gold-standard multilingual news-location dataset, NewsLOC. It contains the annotation of the relevant locations (and their WikiData IDs) of 600+ Wikinews articles in five different languages: English, French, German, Italian, and Spanish. Through experimental evaluations, we show that our proposed system outperforms the baselines and the fine-tuned version of the model using semi-supervised data that increases the classification rate. The source code and the NewsLOC dataset are publicly available for being used by the research community at https://github.com/vsuarezpaniagua/NewsLocation.

translated by 谷歌翻译

Concentration inequalities for leave-one-out cross validation

Benny Avelin , Lauri Viitasaari

分类：机器学习 | (统计)机器学习

2022-11-04

In this article we prove that estimator stability is enough to show that leave-one-out cross validation is a sound procedure, by providing concentration bounds in a general framework. In particular, we provide concentration bounds beyond Lipschitz continuity assumptions on the loss or on the estimator. In order to obtain our results, we rely on random variables with distribution satisfying the logarithmic Sobolev inequality, providing us a relatively rich class of distributions. We illustrate our method by considering several interesting examples, including linear regression, kernel density estimation, and stabilized / truncated estimators such as stabilized kernel regression.

translated by 谷歌翻译

Knowledge Based Template Machine Translation In Low-Resource Setting

Zilu Tang , Derry Wijaya

分类：自然语言处理 | 机器学习

2022-09-08

将标签纳入神经机器翻译（NMT）系统已显示出令人鼓舞的结果，可以帮助翻译诸如命名实体（NE）之类的稀有单词。但是，在低资源环境中翻译NE仍然是一个挑战。在这项工作中，我们研究了在不同级别的资源条件下，在平行语料库中使用标签和NE高核的效果。我们发现标签和复制机制（标记源句子中的NES并将其复制到目标句子）仅在高资源设置中改进翻译。引入复制还会导致翻译不同词性部分（POS）的两极化效果。有趣的是，我们发现高鼻的复制精度始终高于实体。为了避免在引导稀有实体中“硬”复制和利用Hypernym的一种方式，我们引入了“软”标记机制，并发现高水回设置和低资源设置的一致改进。

translated by 谷歌翻译

RX-ADS: Interpretable Anomaly Detection using Adversarial ML for Electric Vehicle CAN data

Chathurika S. Wickramasinghe , Daniel L. Marino , Harindra S. Mavikumbure , Victor Cobilean , Timothy D. Pennington , Benny J. Varghese , Craig Rieger , Milos Manic

分类：机器学习 | 人工智能

2022-09-05

最近一年带来了电动汽车（EV）和相关基础设施/通信的大幅进步。入侵检测系统（ID）被广泛部署在此类关键基础架构中的异常检测。本文提出了一个可解释的异常检测系统（RX-ADS），用于在电动汽车中的CAN协议中进行入侵检测。贡献包括：1）基于窗口的特征提取方法； 2）基于深度自动编码器的异常检测方法； 3）基于对抗机器学习的解释生成方法。在两个基准CAN数据集上测试了提出的方法：OTID和汽车黑客。将RX-ADS的异常检测性能与这些数据集的最新方法进行了比较：HID和GID。 RX-ADS方法提出的性能与HIDS方法（OTIDS数据集）相当，并且具有超出HID和GID方法（CAR HACKING DATASET）的表现。此外，所提出的方法能够为因各种侵入而引起的异常行为产生解释。这些解释后来通过域专家使用的信息来检测异常来验证。 RX-ADS的其他优点包括：1）该方法可以在未标记的数据上进行培训； 2）解释有助于专家理解异常和根课程分析，并有助于AI模型调试和诊断，最终改善了对AI系统的用户信任。

translated by 谷歌翻译

Online Meta-Learning for Model Update Aggregation in Federated Learning for Click-Through Rate Prediction

Xianghang Liu , Bartłomiej Twardowski , Tri Kurniawan Wijaya

分类：人工智能 | 机器学习

2022-08-30

在点击率（CTR）预测的联合学习（FL）中，用户的数据未共享以保护隐私。学习是通过在客户端设备上本地培训进行的，并仅将模型更改传达给服务器。有两个主要的挑战：（i）客户异质性，制作使用加权平均来汇总客户模型更新的FL算法的进步缓慢且学习结果不令人满意；（ii）由于每个实验所需的大量计算时间和资源，因此使用反复试验方法调整服务器学习率的困难。为了应对这些挑战，我们提出了一种简单的在线元学习方法，以学习汇总模型更新的策略，该方法根据客户属性适应客户的重要性并调整更新的步骤大小。我们在公共数据集上进行广泛的评估。我们的方法在收敛速度和最终学习结果的质量方面都大大优于最先进的方法。

translated by 谷歌翻译

Clustering Egocentric Images in Passive Dietary Monitoring with Self-Supervised Learning

Jiachuan Peng , Peilun Shi , Jianing Qiu , Xinwei Ju , Frank P. -W. Lo , Xiao Gu , Wenyan Jia , Tom Baranowski , Matilda Steiner-Asiedu , Alex K. Anderson

分类：计算机视觉

2022-08-25

在我们最近在加纳被动饮食监测的饮食评估现场研究中，我们收集了超过25万件野外图像。该数据集是一种持续的努力，旨在通过被动监控摄像头技术在低收入和中等收入国家中准确测量单个食物和营养摄入量。目前的数据集涉及加纳农村地区和城市地区的20个家庭（74个受试者），研究中使用了两种不同类型的可穿戴摄像机。一旦开始，可穿戴摄像机会不断捕获受试者的活动，该活动会产生大量的数据，以便在进行分析之前清洁和注释。为了简化数据后处理和注释任务，我们提出了一个新颖的自学学习框架，以将大量以自我为中心的图像聚集到单独的事件中。每个事件都由一系列时间连续和上下文相似的图像组成。通过将图像聚集到单独的事件中，注释者和营养师可以更有效地检查和分析数据，并促进随后的饮食评估过程。在带有地面真实标签的固定测试套装上验证，拟议的框架在聚集质量和分类准确性方面优于基准。

translated by 谷歌翻译

Tackling Long-Tailed Category Distribution Under Domain Shifts

Xiao Gu , Yao Guo , Zeju Li , Jianing Qiu , Qi Dou , Yuxuan Liu , Benny Lo , Guang-Zhong Yang

分类：计算机视觉

2022-07-20

当1）培训数据集的类别分布P（Y）时，机器学习模型无法在现实世界应用程序上表现良好。现有方法无法处理存在两个问题的方案，但是对于现实世界应用程序来说，这很常见。在这项研究中，我们向前迈出了一步，研究了域转移下的长尾分类问题。我们设计了三个新颖的核心功能块，包括分布校准的分类损失，视觉语义映射和语义相似性引导性增强。此外，我们采用了一个元学习框架，该框架集成了这三个区块，以改善对看不见的目标域的域概括。为此问题提出了两个新的数据集，称为AWA2-LTS和Imagenet-LTS。我们在两个数据集上评估了我们的方法，并且广泛的实验结果表明，我们提出的方法可以比最新的长尾/域概括方法和组合实现优越的性能。源代码和数据集可以在我们的项目页面https://xiaogu.site/ltds上找到。

translated by 谷歌翻译

Mining Discriminative Food Regions for Accurate Food Recognition

Jianing Qiu , Frank P. -W. Lo , Yingnan Sun , Siyao Wang , Benny Lo

分类：计算机视觉

2022-07-08

自动食品识别是迈向被动饮食监测的第一步。在本文中，我们通过开采歧视性食品地区解决了食品识别问题。从对抗性擦除中汲取灵感，该策略逐渐发现判别对象区域以弱监督语义细分，我们提出了一种新型的网络体系结构，其中主要网络保持了对输入图像进行分类的基本准确性，辅助网络对抗性地矿山挖掘了歧视食品区域，歧视食物区域，歧视食物区域，歧视食物区域，歧视图像。区域网络对所得的开采区域进行了分类。然后将全局（原始输入图像）和本地（矿区）表示为最终预测。拟议的架构表示为par-net，是端到端的训练，并以在线方式突出显示歧视区域。此外，我们推出了一个名为Sushi-50的新的细粒食品数据集，该数据集由50种不同的寿司类别组成。已经进行了广泛的实验来评估所提出的方法。在选择的三个食物数据集（Food-101，Vireo-172和Sushi-50）上，我们的方法始终如一地执行并取得了最先进的结果（TOP-1测试准确性$ 90.4 \％\％$，$ 90.2 \％\％$ $ ，分别为$ 92.0 \％$）与其他现有方法相比。数据集和代码可在https://github.com/jianing-qiu/parnet上找到

translated by 谷歌翻译